F(x)를 f(p(x), v(x))로 만들었다. 함수 f는 ‘몬테카를로 트리탐색(MCTS·Monte Carlo Tree Search)’ 알고리즘이고, 함수 p는 ‘정책망(policy network)’으로 구현된 분기결정 경험 함수, 함수 v는 ‘가치망(value network)’으로 구현된 승률계산 경험 함수다. x는 바둑판의 모양에서 얻어진 특징값이다. 알파고 ...
구조를 모색하는 방법을 찾고 있다. 대표적 예가 ‘몬테카를로 탐색’(Monte Carlo search)법이다. 우선 임의적으로 하나의 구조를 만들고 안정도를 측정한 후 같은 방법으로 또다른 구조를 만든다. 그리고 이 둘의 안정도를 측정해 더 안정한 구조를 택하는 방법이다. 이 과정을 수십만에서 수억번 이상 ...
통해 많은 경우를 시행해서 결과를 유출해 낼 수도 있다. 이를 몬테 칼로(Monte Carlo) 방법이라 부르는데, 무작위로(random) 숫자를 만들어 내는 것이 필요하게 된다. 즉 50명에게 무작위로 생일을 주고 같은 생일을 가진 사람이 있나 검토하는 것을 무한히 반복하면 이론상의 결과와 같아질 것이다. 이 ...